事物互联网(物联网)是一个由嵌入式传感器和服务网络为特征的范例。结合了这些传感器以收集各种信息,跟踪物理条件,例如废物箱状态,并使用不同的集中平台交换数据。对这种传感器的需求正在增加;然而,技术的扩散具有各种挑战。例如,如何使用IoT及其相关数据来增强废物管理?在智能城市,有效的废物管理系统至关重要。人工智能(AI)和启用IOT的方法可以赋予城市管理废物收集。这项工作提出了一种在给定空间约束的支持物联网的废物管理系统中提供推荐的智能方法。它基于基于AI的方法进行彻底的分析,并比较它们的相应结果。我们的解决方案基于多级决策过程,其中考虑到箱子状态和坐标以解决路由问题。这种基于AI的模型可以帮助工程师设计可持续的基础设施系统。
translated by 谷歌翻译
Recently, many attempts have been made to construct a transformer base U-shaped architecture, and new methods have been proposed that outperformed CNN-based rivals. However, serious problems such as blockiness and cropped edges in predicted masks remain because of transformers' patch partitioning operations. In this work, we propose a new U-shaped architecture for medical image segmentation with the help of the newly introduced focal modulation mechanism. The proposed architecture has asymmetric depths for the encoder and decoder. Due to the ability of the focal module to aggregate local and global features, our model could simultaneously benefit the wide receptive field of transformers and local viewing of CNNs. This helps the proposed method balance the local and global feature usage to outperform one of the most powerful transformer-based U-shaped models called Swin-UNet. We achieved a 1.68% higher DICE score and a 0.89 better HD metric on the Synapse dataset. Also, with extremely limited data, we had a 4.25% higher DICE score on the NeoPolyp dataset. Our implementations are available at: https://github.com/givkashi/Focal-UNet
translated by 谷歌翻译
深度学习一直是近来最具破坏性的技术进步之一。深度学习模型的高性能以高度计算,存储和功率要求为代价。感知到加速和压缩这些模型以提高设备性能的直接需求,我们引入了Deeplite Neutrino,以便对模型的生产优化和Deeplite运行时进行介绍,以在基于ARM的平台上部署超低位量化模型。我们为ARMV7和ARMV8架构实施低级量化内核,可在32位和64位基于ARM的设备上进行部署。通过使用矢量化,并行化和平铺的有效实现,与具有XNNPACK后端的TensorFlow Lite相比,我们在分类和检测模型上分别实现了高达2倍和2.2倍的速度。与ONNX运行时相比,我们还获得了高达5倍和3.2倍的显着加速,分别用于分类和检测模型。
translated by 谷歌翻译
人工智能的最新趋势是将验证的模型用于语言和视觉任务,这些模型已经实现了非凡的表现,但也令人困惑。因此,以各种方式探索这些模型的能力对该领域至关重要。在本文中,我们探讨了模型的可靠性,在其中我们将可靠的模型定义为一个不仅可以实现强大的预测性能,而且在许多涉及不确定性(例如选择性预测,开放式设置识别)的决策任务上,在许多决策任务上表现出色,而且表现良好。强大的概括(例如,准确性和适当的评分规则,例如在分布数据集中和分发数据集上的对数可能性)和适应性(例如,主动学习,几乎没有射击不确定性)。我们设计了40个数据集的10种任务类型,以评估视觉和语言域上可靠性的不同方面。为了提高可靠性,我们分别开发了VIT-PLEX和T5-PLEX,分别针对视觉和语言方式扩展了大型模型。 PLEX极大地改善了跨可靠性任务的最先进,并简化了传统协议,因为它可以改善开箱即用的性能,并且不需要设计分数或为每个任务调整模型。我们演示了高达1B参数的模型尺寸的缩放效果,并预处理数据集大小最多4B示例。我们还展示了PLEX在具有挑战性的任务上的功能,包括零射门的开放式识别,主动学习和对话语言理解中的不确定性。
translated by 谷歌翻译
贝叶斯优化(BO)已成为许多昂贵现实世界功能的全球优化的流行策略。与普遍认为BO适合优化黑框功能的信念相反,它实际上需要有关这些功能特征的域知识才能成功部署BO。这样的领域知识通常表现在高斯流程先验中,这些先验指定了有关功能的初始信念。但是,即使有专家知识,选择先验也不是一件容易的事。对于复杂的机器学习模型上的超参数调谐问题尤其如此,在这种模型中,调整目标的景观通常很难理解。我们寻求一种设定这些功能性先验的替代实践。特别是,我们考虑了从类似功能的数据中,使我们可以先验地进行更紧密的分布。为了验证我们在现实的模型培训设置中的方法,我们通过训练在流行图像和文本数据集上的数以万计的近状态模型配置来收集了大型多任务超参数调谐数据集,以及蛋白质序列数据集。我们的结果表明,平均而言,我们的方法能够比最佳竞争方法更有效地定位良好的超参数。
translated by 谷歌翻译
在本文中,我们研究了DNN培训中量化的影响。我们假设重量量化是正则化的一种形式,正则化的量与量化水平(精度)相关。我们通过提供分析研究和经验结果来证实我们的假设。通过将重量量化为重量噪声的一种形式,我们探讨了该噪声在训练时如何通过网络传播。然后,我们表明该噪声的大小与量化水平相关。为了确认我们的分析研究,我们在本文中进行了广泛的实验列表,其中我们表明,在各种数据集中,在各种视觉任务和模型中可以看到量化的正则化效果。基于我们的研究,我们建议8位量化在不同的视觉任务和模型中提供了一种可靠的正则化形式。
translated by 谷歌翻译
当前,随机化是用于机器人技术中数据驱动的学习算法的SIM2REAL传输中广泛使用的方法。尽管如此,大多数SIM2REAL研究报告了特定随机技术的结果,并且通常是在高度定制的机器人系统上,因此很难系统地评估不同的随机方法。为了解决这个问题,我们为机器人触及余量操纵器任务定义了易于制作的实验设置,该设置可以作为比较的基准。我们将四个随机策略与模拟和真实机器人中的三个随机参数进行比较。我们的结果表明,更多的随机化有助于SIM2REAL转移,但它也可能损害算法在模拟中找到良好策略的能力。完全随机的仿真和微调显示出差异化的结果,并且比测试的其他方法更好地转化为实际机器人。
translated by 谷歌翻译
高斯流程提供了一个优雅的框架,用于在功能上指定先验和后验分布。但是,它们在计算上也很昂贵,并且受其协方差函数的表达性限制。我们提出了基于扩散模型的新方法神经扩散过程(NDP),该方法学会了从功能上分布中采样。使用新颖的注意力块,我们可以将随机过程(例如交换性)的属性直接融合到NDP的体系结构中。我们从经验上表明,NDP能够捕获与高斯过程的真正贝叶斯后部接近的功能分布。这可以实现各种下游任务,包括高参数边缘化和贝叶斯优化。
translated by 谷歌翻译
仿制学习是通过利用专家驱动程序演示的数据来学习自主驾驶政策的强大方法。然而,通过模仿学习训练的驾驶政策忽视专家演示的因果结构产生了两个不良行为:惯性和碰撞。在本文中,我们提出了因果模拟模型(CIM)来解决惯性和碰撞问题。CIM明确发现了因果模型,并利用它来培训政策。具体而言,CIM将输入解散到一组潜在变量,选择因果变量,并通过利用所选变量来确定下一个位置。我们的实验表明,我们的方法在惯性和碰撞率方面优于以前的工作。此外,由于利用因果结构,CIM仅将输入维度缩小到两个,因此,可以在几次拍摄设置中适应新环境。代码可在https://github.com/vita -epfl/cim使用。
translated by 谷歌翻译
现在是车辆轨迹预测是自动驾驶汽车的基本支柱。行业和研究社区都通过运行公共基准来承认这一柱的需求。而最先进的方法令人印象深刻,即,他们没有越野预测,他们对基准之外的城市的概括是未知的。在这项工作中,我们表明这些方法不会概括为新场景。我们提出了一种新颖的方法,可自动生成逼真的场景,导致最先进的模型越野。我们通过对抗场景生成的镜头来框架问题。我们推广基于原子场景生成功能的简单而有效的生成模型以及物理约束。我们的实验表明,可以在制作预测方法失败的方式中修改来自当前基准的超过60 000 \%$ 60 \%。我们进一步表明(i)生成的场景是现实的,因为它们确实存在于现实世界中,并且(ii)可用于使现有型号强大30-40%。代码可在https://sattack.github.io/处获得。
translated by 谷歌翻译